OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!
OpenAI 刚刚开源了 PaperBench,用于评估 Agent 复现顶尖论文能力!PaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理解研究论文、独立开发代码并执行实验以复现研究结果。
PaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理解研究论文、独立开发代码并执行实验以复现研究结果。
2025 年,DeepSeek 爆火带动传统产品的智能化升级,如传统玩具向 AI 玩具转型。央视新闻调查数据显示,2025 年 1 月,国内某电商平台面向 3-6 岁儿童的 AI 早教玩具销量环比增长 6 倍。咨询公司 IMARC 的预测数据显示,2024 年全球 AI 玩具市场规模已达 181 亿美元,预计到 2033 年将增长至 600 亿美元。
刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。
上周,OpenAI 正式支持 MCP 协议的消息,无疑成为 AI 基础设施演进的重要里程碑。短短几个月内,从 Anthropic 首次提出到微软、OpenAI 等巨头先后加入,这一标准正在以惊人的速度完成从提出、验证到主流采纳的跃迁。
高通今日宣布收购越南人工智能开发商 MovianAI。MovianAI 是 VinAI Application and Research JSC 的生成式 AI 部门,后者是越南最大企业集团 Vingroup 旗下的机器学习研究实验室。此次收购后,包括前 DeepMind 研究科学家、VinAI 首席执行官 Hung Bui 在内的核心团队将加入高通。
日本的国有企业 Rapidus Corp. 近日开始调整其芯片制造设备,预计将在本月底前启动先进半导体的试生产。这一步骤对于 Rapidus 而言至关重要,因为公司正努力进入人工智能(AI)组件市场。作为一家成立仅两年的初创企业,Rapidus 计划到2027年大规模生产采用2纳米工艺的半导体,届时其制造能力将与台湾 的半导体制造巨头台积电相匹敌。
大家好,我是小瑶,今天是你们的 AI 前排吃瓜 + 技术解读博主。
0个Web端AI应用类型中,只有1个应用类型(AI导航网站)MAU仍停滞在百万量级,其余19个应用类型MAU均在千万量级以上,整体量级远高于国内AI市场。有3个应用类型MAU超1亿(与1月持平),分别是AI聊天机器人、AI搜索引擎和AI设计工具,ChatGPT、Canva AI和New Bing持续领跑这3个亿级赛道,格局稳定;
3月31日,随着iOS18.4更新,Apple Intelligence正式支持包括简体中文、法语、德语、意大利语、葡萄牙语(巴西)、西班牙语、日语和韩语在内的多种语言,并提供新加坡和印度版本的本地化英语。
在今天数字图像无处不在,而高质量的图片对于各种项目至关重要。然而,许多人对于那些无聊、过度使用的传统库存照片感到厌倦,他们渴望与众不同、创新的视觉效果。这就是为什么 Lummi 库存图片的出现如此重要。